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Tipuri de date atomice în Python 


Stephen Davies 


Rezumat 


Când spunem că unele date sunt „atomice”, nu înseamnă că sunt radioactive; vrem să 
spunem că sunt indivizibile. 

Anticii vorbeau despre „atomi” drept cele mai mici bucăţi posibile de materie. Dacă 
împărțiți orice obiect fizic — să zicem, un măr — în părți, obţineţi componentele sale: o tulpină, 
pielița, seminţe şi miezul dulce și suculent. Tăiaţi oricare dintre aceste bucăţi cu un cuţit și veți 
obține bucăţi mai mici. Dacă continuaţi să le divizați din ce în ce mai mult, filozofii precum 
Democrit au argumentat că veţi ajunge în cele din urmă la mici biţi indivizibili care nu mai pot fi 
divizați în continuare. Aici se află lumea fizică la cel mai înalt grad de granularitate. 

În mod similar, o piesă de date atomice este tratată de obicei ca o unitate întreagă, nu ca 
ceva cu structură internă care poate fi defalcată. Există diferite moduri în care aceşti atomi de date 
pot fi strânşi împreună și organizați în ansambluri mai mari. 
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TIPURI DE DATE ATOMICE ÎN PYTHON 


e: python 


Date atomice 


Când spunem că unele date sunt „atomice”, nu înseamnă că sunt radioactive; vrem să 
spunem că sunt indivizibile. 

Anticii vorbeau despre „atomi” drept cele mai mici bucăţi posibile de materie. Dacă 
împărțiți orice obiect fizic — să zicem, un măr — în părţi, obţineţi componentele sale: o tulpină, 
pieliţa, seminţe şi miezul dulce şi suculent. Tăiaţi oricare dintre aceste bucăţi cu un cuţit şi veți 
obţine bucăţi mai mici. Dacă continuaţi să le divizați din ce în ce mai mult, filozofii precum 
Democrit au argumentat că veţi ajunge în cele din urmă la mici biţi indivizibili care nu mai pot fi 
divizați în continuare. Aici se află lumea fizică la cel mai înalt grad de granularitate. 

În mod similar, o piesă de date atomice este tratată de obicei ca o unitate întreagă, nu ca 
ceva cu structură internă care poate fi defalcată. Există diferite moduri în care aceşti atomi de date 


pot fi strânşi împreună și organizați în ansambluri mai mari. 


Medii şi variabile 


Un program de analiză a datelor foloseşte un mediu pe măsură ce rulează. „Mediu” 
înseamnă doar „toate datele care sunt vizualizate în prezent şi pe care programul le poate accesa.” 
(1) Mediul este format din variabile, fiecare (de obicei) având un nume şi o valoare. De exemplu, 
s-ar putea să avem o variabilă numită vârstă a cărei valoare este 21 şi o variabilă numită slogan 
a cărei valoare este „Unu pentru toți și toţi pentru unu”. 

Fiecare variabilă din mediu trebuie să aibă un nume distinct (adică, nu există două variabile 
care să poarte acelaşi nume). De asemenea, important, motivul pentru care aceste elemente de bază 


sunt numite „variabile” este că valoarea lor se poate schimba pe măsură ce programul se execută. 
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Deşi putem crea inițial o variabilă age cu valoarea 21, mai târziu în program, valoarea variabilei 


s-ar putea schimba la 22, sau 50 sau 0. Numele variabilei nu se schimbă niciodată. 


Tipuri de date atomice 


Există un alt lucru pe care o variabilă îl are pe lângă numele și valoarea sa: un tip. (2) Într- 
un limbaj de programare precum Python, fiecare bucată de date are un tip specific, care este necesar 
pentru a determina cum se comportă și tot ce puteţi face cu ea. O întrebare pe care ar trebui să o 
pui mult este: „bine, am o variabilă în mediul meu numită x ... acum care este tipul ei?” Este 
posibil să fi ghicit (corect) că variabilele noastre de vârstă şi slogan din secțiunea anterioară sunt 
de diferite tipuri: una este un număr, iar cealaltă este o frază. 


Există trei tipuri principale de date atomice. 


Numere întregi 


Un tip foarte comun de date sunt numerele întregi sau întregii. Acestea sunt de obicei 
pozitive, dar pot fi şi negative, şi nu au nicio zecimală. Lucruri precum anul naşterii unei persoane, 
votul total al unui candidat sau numărul de „aprecieri” al unei postări pe rețelele sociale sunt 


reprezentate cu acest tip de date. 


Numere reale (fracţionale) 


Vă puteţi aminti din matematica liceului că așa-numitele „numere reale” includ nu numai 
numere întregi, ci şi numere cu cifre după virgula zecimală. Prin urmare, acest tip poate fi utilizat 
pentru a stoca ratele dobânzilor, citirile de temperatură și ratingurile medii ale filmelor pe o scară 
de la 1 la 5. 

Deoarece toate numerele întregi sunt numere reale, s-ar putea să vă întrebaţi de ce ne 
deranjăm să definim două tipuri diferite pentru acestea. De ce să nu dai doar ambelor tipuri de 
variabile acelaşi tip, de număr real? Practic, răspunsul este că ceva „se simte a fi greșit” în acest 
sens pentru comunitatea ştiinţei datelor. Un utilizator Facebook ar putea avea 240 de prieteni sau 
241, dar niciodată nu ar avea sens să aibă 240,3 prieteni. A apărut astfel un consens: variabilele 
care ar stoca numai numere întregi ar trebui să fie într-adevăr de un tip dedicat doar numerelor 
întregi. Puteţi încălca această convenţie, dar veţi fi considerat ciudat de colegii dvs. dezvoltatori 


dacă faceți acest lucru. 
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Text 


În cele din urmă, unele valori care nu sunt deloc numerice, cum ar fi numele unui client, 
titlul emisiunii sau un tweet. Deci, al treilea tip de date este textual. Variabilele de acest tip au o 
secvenţă de caractere ca valori. Aceste caractere sunt de cele mai multe ori litere, dar pot include 
ŞI spaţii, punctuație şi caractere din alte alfabete. 

Apropo, acest al treilea tip de date se poate îndrepta până la linia „atomică” şi uneori o 
poate traversa. Cu alte cuvinte, vom lucra ocazional cu valorile textului non-atomic, împărțindu- 
le în cuvintele lor constitutive sau chiar în litere. De cele mai multe ori, totuși, vom trata o secvență 
de caractere precum „Avengers: Endgame” ca o singură bucată de date indivizibilă în același mod 


în care tratăm un număr ca 42. 


Dar ce zici de ...? 


Ce se întâmplă cu alte lucruri pe care le poate stoca un computer: fișiere de imagini, 
melodii, videoclipuri? Se pare că, prin trucuri inteligente, toate aceste tipuri de suporturi și multe 
altele pot fi reduse la un număr mare de numere întregi, şi stocate într-o structură de date cumulată. 


La nivel atomic, rămân cele trei tipuri prezentate mai sus. 


Cele trei tipuri în Python 


Cele trei tipuri obișnuite de date atomice descrise mai sus sunt în limbaj general: aceasta 
înseamnă că sunt conceptuale, nu sunt legate de niciun limbaj de programare specific sau 
instrument de analiză. Orice tehnologie utilizată pentru știința datelor va avea capacitatea de a face 
faţă acestor trei tipuri de bază. Modalităţile specifice în care fac acest lucru vor diferi oarecum de 


la o limbă la alta. Să aflăm cum le implementează Python. 


Numere întregi: int 


Unul dintre cele mai de bază tipuri de date Python este „int”, care înseamnă „întreg”. Este 
ceea ce folosim pentru a reprezenta numerele întregi. 

În Python, creaţi o variabilă prin simpla tastare a numelui său, a unui semn egal şi apoi a 
valorii sale inițiale, astfel: 

izesvoluie Leia = 11776 


Aceasta este prima noastră linie de cod (3). După cum vom vedea, liniile de cod sunt 


executate una câte una — există un timp înainte şi un timp după, fiecare linie este efectiv executată. 
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Acest lucru se va dovedi a fi foarte important. (Oh, iar o „linie de cod” este uneori numită şi o 
instrucţiune.) 

Numele variabilelor Python pot fi cât de lungi doriți, cu condiţia să fie alcătuite doar din 
litere mari şi mici, cifre şi caractere de subliniere. (Trebuie să fiți în concordanţă cu scrierea dvs. 
cu majuscule și cu ortografia dvs.: nu puteți apela o variabilă Movie într-o linie de cod şi movie 
în alta.) Sublinierile (undersore) sunt adesea folosite ca pseudo-spaţii, dar nu sunt permise alte 
semne de punctuație ciudate în numele unei variabile. (4) 

Şi întrucât suntem la subiect, permiteți-mi să vă încurajez să vă numiţi bine variabilele. 
Aceasta înseamnă că fiecare nume de variabilă ar trebui să reflecte exact ceea ce reprezintă 
valoarea pe care o stochează. Exemplu: dacă o variabilă este menită să stocheze ratingul (în „stele”) 
pe care un utilizator IMDB l-a acordat unui film, nu o denumiți movie. Denumiţi-o rating. (Sau 
chiar mai bine, movie_rating.) Credeţi-mă: atunci când lucrezi la un program complex, există 
suficiente lucruri grele la care să te gândești fără să te încurci pe tine (şi colegii tă1) prin nume de 
variabile apropiate, dar nu exacte. (5) 

Acum amintiţi-vă că o variabilă are trei lucruri — un nume, o valoare şi un tip. Primele două 
apar în mod explicit în linia de cod în sine. În ceea ce priveşte tipul, de unde ştie Python că 
revolution ar trebui să fie un „int?” Simplu: este un număr fără punct zecimal. 

Ca o verificare a corectitudinii, putem cere lui Python să ne spună în mod explicit tipul 


variabilei, scriind acest cod: 

type (revolution) 

Dacă această linie de cod este executată după executarea celei anterioare, Python răspunde 
cu: 

int 

Deci, asta e. 

Iată un alt „fragment de cod” (“code snippet” un termen care înseamnă doar „unele linii 
de cod pe care mă concentrez, care sunt, în general, doar o parte a unui program mai mare”): 

izesvoluie lia = 11776 


moon landing = 1969 


izevoliical dia = 1917 
Acum, dacă aceasta ar fi o clasă de matematică, acel set de ecuaţii ar fi absurd. Cum ar 
putea aceeaşi variabilă (revolution) să aibă două valori contradictorii? Dar într-un program, acest 


lucru este perfect legitim: înseamnă doar că imediat după executarea primei linii de cod, revolution 
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are valoarea 1776, iar câteva momente mai târziu, după executarea celei de-a treia linii, valoarea 
sa s-a schimbat la 1917. Valoarea sa depinde în întregime de „pe unde este programul” în timpul 


execuţiei sale. 


Numere reale (fracţionale): float 


Singurul lucru ciudat despre al doilea tip de date din Python este numele său. În alt univers, 
s-ar fi putut numi o variabilă „reală” sau „zecimală” sau „fracţionată”, dar din anumite motive 
istorice bizare este numită float. (6) 

Toate aceleași reguli şi reglementări se referă la float, la fel ca la int; singura diferenţă este 


că tastaţi un punct zecimal. Astfel: 
GPA =3.17 
jSizaL Gia (Ge (Claneal Seaca Li6VlSOVIE ai Slide = 995 95 


AAC EIZESIE LELE = (69 
Reţineți că variabila interest _rate este într-adevăr un tip float (chiar dacă nu are parte 


fracțională) deoarece am tastat o perioadă: 


EA 8S ((alianceiz osie, zece) 


| ficat 


Text: str 


Vorbind de nume ciudate, o variabilă de text Python este de tip str, care înseamnă „şir” 
“string”. Ai putea să te gândești la asta ca la o grămadă de litere „strânse” împreună ca un colier 
cu mărgele. 

Important: atunci când specificaţi o valoare str, trebuie să utilizați ghilimele (simple sau 
duble). În primul rând, așa știe Python că intenţionaţi să creaţi un str, spre deosebire de un alt tip. 


Exemple: 
sillamej => Vaie 
Gpeelela = Siza 
elene. seize = aul” e IBeldeizy* 


url = "'http://umweagles.com” 


Observaţi, apropo, că un șir de cifre nu este acelaşi lucru cu un întreg. Pentru a înţelege: 


SElan/a it pene GjSeie weagjaie = 24, 


eisiciiea moale = 500% 


INTERNET — MOBILE 


type (schwarzenegger_ weight) 
int 

type (action movie) 

| str 


Vedeţi? Ghilimelele fac toată diferența. 


Lungimea unui şir 


Probabil cel mai de bază este pur şi simplu să întrebi despre lungimea unui şir sau despre 
numărul de caractere pe care le conţine. Pentru a face acest lucru, includem numele variabilei între 


paranteze după cuvântul len: 


len (slang) 


| e 
len (donut_ store) 


[13 


După cum vom vedea, operaţia len() (şi multe altele ca aceasta) este un exemplu de funcție 
în Python. În limbajul adecvat, atunci când scriem o linie de cod precum len (donut_store) spunem 
că „apelăm funcţia”, ceea ce înseamnă pur și simplu să o invocăm sau să o declanşăm. 

Mai mult lingo: din motive obscure, valoarea din interiorul parantezelor (aici, 
donut_store) este numită un argument pentru funcție. Şi spunem că „trecem” unul sau mai multe 
argumente unei funcții atunci când o apelăm. 

Toţi acești termeni pot părea pedanțţi, dar sunt exacţi și folosiți universal, aşa că asiguraţi- 
vă că îi învăţaţi. Linia de cod precedentă poate fi complet rezumată spunând: 

„Apelăm la funcţia len() şi îi trecem variabila donut_store ca argument.” 

Reţineţi, apropo, că funcția len() aşteaptă un argument str. Nu puteți apela len() cu o 


variabilă int sau float ca argument: 


schwarzenegger_ weight = 249 


len (schwarzenegger_ weight) 


| Iypetrror: object of type int! has no lenţ() 
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(Aţi putea crede că „lungimea” unui int ar fi numărul său de cifre, dar nu e așa.) 
Un lucru pe care elevii îl confundă adesea este diferența dintre o variabilă de şir numită şi 


cea a unei valori de şir (nenumită). Luaţi în considerare diferența în rezultatele următoarelor: 
sileiasj => Vlatie 
len (slang) 


|: 


len('slang! ) 
|5 


In primul exemplu, am întrebat „cât de lungă este valoarea în variabila slang?” Răspunsul 
a fost 3, deoarece „lit” are trei caractere. In al doilea exemplu, am întrebat „cât de lung este 
cuvântul „slang”?” iar răspunsul este 5. Nu uitaţi: numele variabilelor nu se pun niciodată între 


ghilimele. Dacă ceva este între ghilimele, este luat /itera/. 


Combinarea și tipărirea variabilelor 


Puteţi face o mulțime de lucruri cu alte variabile decât să le creați. Un lucru pe care doriți 
să-l faceți frecvent este să imprimaţi o variabilă, ceea ce înseamnă să puneţi valoarea acesteia pe 


pagină, astfel încât să o puteţi vedea. Acest lucru se face cu ușurință apelând funcția print(): 
print (donut_ store) 

|SizaLiaie (joci ee GE (Claneal she alea ILiSuleyo lic alia Glalexe8))) 

size (g.Leiagj)) 

print (slang) 


Paul's Bakery 
395 95 
slang 
IL atit 
Din nou, nu ratați diferenţa crucială dintre tipărirea lui „slang” și tipărirea lui slang. Primul 
este literal şi cel de-al doilea nu. În prima dintre acestea, trecem cuvântul „slang” ca argument, nu 
variabila slang. 
Deseori vom dori să combinăm biţi de informaţii într-o singură instrucțiune de tipărire. De 


obicei, una dintre variabile este un şir care conține mesajul general. Există mai multe modalități 


de a realiza acest lucru, dar cea mai flexibilă se va dovedi a fi metoda .format(). 
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O metodă este foarte asemănătoare cu o funcție, dar nu exact. Diferenţa constă în sintaxa 
utilizată pentru a o numi. Când apelaţi o funcție (cum ar fi type) sau len(Q)), pur şi simplu 
introduceți numele acesteia, urmată de o pereche de paranteze în interiorul cărora puneţi 
argumentele (separate prin virgule, dacă există mai multe). Dar când „apelaţi o metodă”, puneţi o 
variabilă înainte de un punct (,,.”) şi numele metodei, apoi parantezele. Aceasta este denumită 
„apelarea metodei pe variabilă”. 


Sună mai confuz decât este. Iată un exemplu de .format() în acţiune: 
joi ee ie (ClamealgheaLeia LSwiloouical ia. Slaoeg = 99595 


message = "Honey, I spent S$() today!” 


|Sz aLiae (as SeiSIE « 1EO):Zene ((jBiziL ele 10iE (Claizil seal anni  IOABlOVO)LE alia Slauo=15))) ) 

Reţineţi cum scriem „message.format” în loc de „format”. Acest lucru se datorează 
faptului că .format() este o metodă, nu o funcție. Spunem că apelăm .format() „pe” message și 
trecem price_of_ Christian _Louboutin_shoes ca argument. (7) De asemenea, asigurați-vă că 
observați parantezele duble „„))” la sfârșitul ultimei linii. Avem nevoie de amândouă, deoarece în 
programare, fiecare paranteză stângă trebuie să se potrivească cu o paranteză dreaptă 
corespunzătoare. Întrucât apelăm două funcţii / metode pe o singură linie (printQ) şi .formatQ), 
aveam două paranteze din stânga pe acea linie. Fiecare are nevoie de un partener. 

În ceea ce priveşte specificul modului în care funcţionează .format(), veţi vedea că 
variabila de şir pe care o apelaţi poate include perechi de curlie (acolade). Acestea sunt substituenţi 
pentru locul în care trebuie să lipiţi valorile altor variabile în ieşire. Aceste variabile sunt apoi 
incluse ca argumente pentru metoda .format(). Codul de mai sus produce această ieşire: 

| ionev, I spent $895.95 today! 

Adesea, în loc să creăm un nou nume de variabilă pentru a menţine şirul preformatat, doar 
vom folosi print) literalmente, astfel: 


print (Honey, 1 spent $() today!”.format [ 


JSizaL(e/e (Ge (Clauzal stea ea ILONbloyeyenE Lia Elae=3)) )) 
Încă apelăm de fapt .format() la o variabilă aici, doar că nu ne-am deranjat să numim 
variabila. De asemenea, observați că codul nostru era prea lung pentru a se potrivi frumos pe o 
singură linie, așa că l-am rupt în două şi am indentat a doua linie pentru a clarifica faptul că 


» 


„price_of_...” nu îşi începea propria linie nouă. În mod crucial, toate parantezele sunt încă 
împerecheate, două câte două, chiar dacă parantezele din stânga sunt pe o linie diferită de 


parantezele din dreapta corespunzătoare. 
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În cele din urmă, iată un exemplu mai lung cu mai multe variabile: 
au = Belize Bagseall 

[fiii Aces = 8) 

sosi = 91.73 

print (“Customer () bought () items worth $().”.format (name, 


AU items, cosit).) 


| Customer Pedro Pascal bought 3 items worth $91.73. 


Puteţi vedea cum putem trece mai mult de un argument unei funcții / metode pur și simplu 


separându-le cu virgule în interiorul parantezelor. 


Note 


(1) Această utilizare a termenului „mediu” este diferită de termenul „mediu de 
programare”. 

(2) Strict vorbind, deşi în limbaje precum Java variabilele au într-adevăr tipuri, în Python 
valorile au tipuri, nu variabilele. Această distincție nu este însă importantă pentru noi. 

(3) Apropo, cuvântul cod este gramatical un substantiv de masă, nu un substantiv de 
numărare. Prin urmare, este potrivit să spunem „Am scris un cod aseară”, nu „Am scris câteva 
coduri aseară”. Dacă folosiţi greşit acest lucru, veţi fi marcat imediat ca începător. 

(4) Oh, şi o altă regulă: un nume variabil nu poate începe cu o cifră. Deci, r2d2 este un 
nume de variabilă legală, dar nu şi 007bond. 

(5) Şi consider în totalitate faptul că variabila revolution nu este numită foarte bine. Am 
ales-o doar pentru a evidenția rapid o diferență. 

(6) Dacă sunteți curios, acest lucru se datorează faptului că în limbajul de programare al 
computerului un „număr cu virgulă mobilă” înseamnă un număr în care punctul zecimal ar putea 
fi oriunde. Cu un număr întreg ca -52, punctul zecimal este implicit în partea dreaptă a secvenţei 
de cifre. Dar cu numere precum -5,2 sau -,52 sau -000052 sau chiar 520000, punctul zecimal a 
„plutit” departe de această poziţie fixă. 

(7) Ori de câte ori mă refer la o metodă aici, voi pune un punct înaintea numelui său. De 
exemplu, nu este metoda „format()”, ci metoda „.format()”. 


Sursa: Stephen Davies, The Crystal Ball — Instruction Manual, Vol. Il: Introduction to Data 
Science, v. 1.1. Copyright O 2021 Stephen Davies. Licenţa CC BY-SA 4.0. Traducere şi adaptare 
independente: Nicolae Sfetcu 
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